人工智能会取代物理学家吗?| 集智-凯风复杂系统论坛全天回顾
2019 年 6 月 7 日,正值端午之际,集智俱乐部联合凯风基金会,邀请到集智俱乐部周边的青年学者,在北京举办了以“复杂系统:跨越学科边界的盛宴”专题论坛。14位讲者以各种各样的复杂系统为切入点,分享不同学科在复杂系统研究上的最新进展。
复杂性科学被霍金称为 21 世纪的科学,也是集智俱乐部创办 16 年以来始终关注的核心议题。集智俱乐部公众号已经围绕复杂系统研究进展,推出近千篇学术报道,同时围绕复杂系统和人工智能组织了上百场读书会和讲座活动。
凯风公益基金会,持续关注社会经济系统发展的重大命题,大力支持复杂系统科学的前沿研究。自 2016 年开始,联合集智俱乐部,连续 3 年成功举办“集智-凯风复杂系统研读营”。
讲者分享的重要研究工作,集智俱乐部将持续跟踪报道,请关注后续推文。
以下,是这场跨学科盛宴的亮点回顾:
01 尤亦庄 人工智能会不会取代物理学家
尤亦庄,现为加州大学圣地亚哥分校物理系任助理教授,集智科学家。他于2013年在清华大学高等研究中心取得博士学位,后赴加州大学圣巴巴拉分校及哈佛大学从事博士后研究。主要研究方向是凝聚态系统中的拓扑物相、量子纠缠和机器学习等问题。
他从自己的研究方向讲起。凝聚态物核心的议题是衍生现象,也就是通过微观的个体现象研究集体行为,与复杂系统的思想不谋而合。从物理学上来讲,不仅构成世界的基本粒子可能是衍生的,也可以去思考我们的物理理论、对世界的认识,是如何衍生、涌现出来的?这是更大层面上的涌现。
尤亦庄提出了一个很大胆的问题:假如人类没有建立量子力学,但有量子系统,人工智能可以研究出量子力学吗?他为此做了一系列实验。受到侯世达和机器翻译的启发,加入词语的mapping,即语义空间(Semantic Space)的映射。人工智能将会取代物理学家吗?尤亦庄正在让AI学会现有的物理学知识,期望AI有一天能回答物理学家回答不了的问题。
延伸阅读:
02 吴令飞 技能科学:再造知识经济中的国家人才系统
吴令飞现任匹兹堡大学计算与信息学院助理教授,也是芝加哥大学知识实验室博士后、集智科学家。他的研究方向是计算社会科学、科学学(science of science)。
他报告了自己此前在Nature杂志发表的封面文章,对于科研团队规模的最新研究表明,小团队比大团队更能做出颠覆式的创新。在过去十几年,科研团队的主要组成,从小部分合作者,逐渐变成了规模很大的团体,团队人数甚至远超一只球队。无论是探测深空引力波,还是整合大脑发育的遗传学,要想解答重要的科学问题,通常需要科学家和机构集中资源与数据。每增加团队和人员,研究者就更保守。而在申请科研基金和资助时,小团队却往往比大团队更保守。这不仅是钱的故事,更是如何激励创新、人与人如何合作和沟通的问题。
延伸阅读:
03 孟天广 科技革新与治理转型
孟天广是清华大学社会科学学院政治学系副教授,也是清华大学数据治理研究中心主任。
孟教授结合自己近年研究表示,大数据等数学工具的发展,对社会科学助力很大,成为了国家治理现代化的科技驱力。主要应用于政府开放数据,让社会可以监督;用智慧方式做决策;进行预测预警,回应治理危机等。
他的智能化社会治理(iSG)研究,利用大数据感知城市社会情绪,感知民情民意,挖掘社会运行规律。通过百度指数,可以监测到不同区域、不同时间里的人们在关心什么。同时,互联网的上的民情民意也会影响地方政府决策,在重大政治会议召开之前,通过对数据的分析,了解民意,可以帮助设置政策议程、辅助政策的调整。
延伸阅读:
04 章彦博 神经网络寻找宏观态
章彦博毕业于中国科学技术大学凝聚态物理系,现于美国亚利桑那州立大学攻读复杂系统博士。
他介绍了研究复杂系统的物理学方法,使用神经网络寻找复杂系统的宏观态。宏观态正是如梅拉妮·米歇尔《复杂》中所写的“对生命系统中信息处理的高层次描述”、“一般性原理”。藉由宏观态的数学本质,可以使用神经网络的多目标训练寻找宏观态。宏观态(Macrostate)的实际应用也很多,比如基因调控网络里,通过宏观态可以找到调节整体的基因控制节点。
延伸阅读:
05 崔浩川 自然选择中诞生的结构
崔浩川是北京师范大学系统科学学院的在读博士生,目前的主要研究兴趣为科学学、复杂系统网络等。目前在研究的项目是利用结构信息和元信息预测科学团队合作影响力。
他分享了从结构角度看自增益可持续的组织形式。自然界有许多结构,其实人的社会也是。他介绍了生态学中的嵌套性(Nestedness)概念,在生态世界里,有显著嵌套的网络都显示出更高的生物多样性增长,减少竞争。而在社会经济网络中,也有研究显示,成功的国家都具有高度的多样性特征,与竞争激烈的动态生态环境相似。
延伸阅读:
06 李林倬 不确定性如何塑造经济生活和市场结果
李林倬是清华大学社会学系硕士、美国芝加哥大学社会学系在读博士。
他用一个生动的案例——汉服在儿童服装中的兴起——说明,文化经济是一个超级明星市场,热点的产生具有不确定性,以及这种不确定性如何塑造文化经济生活和市场。传统理论如蛛网模型,常用来研究农产品等生产周期较长的商品在失去均衡时发生的不同波动价格波动,而现在经济学家不再认为某个时间点对整个市场切片得到的东西就是整个市场本身,就像切片的生物不等于生物本身,需要考虑时间尺度的动荡,以及各个元素之间的动力学关系。
延伸阅读:
07 张章 “重构”能带给我们什么
张章,北京师范大学系统科学学院科研助理,今年考入该专业硕士。他也是一直以来活跃在集智俱乐部的成员,对复杂系统、人工智能等学科有浓厚兴趣,有过工业界背景,后因对科学的喜爱而投身于学术界,目前在进行使用机器学习方法进行网络重构等工作。
他分享了自己的科研主要方法:通过观察节点演化数据。先用网络生成器,再生成一个网络,最后用动力学预测器来预测生成的网络。通过把预测的未来数据和真实的未来数据进行对比,再进行反向传播校准,希望最终能达到生成的网络和生成的网络背后运行规则相同。张章还展示了网络结构和重构效果的实验数据。
延伸阅读:
08 李睿琪 打开城市标度律的黑箱
李睿琪是北京化工大学信息学院副教授,北京师范大学系统科学学院、麻省理工大学、波士顿大学联合培养博士。他的研究兴趣在于城市的生长和演化。
李睿琪介绍了他的复杂城市现象背后的城市标度率(Scaling Law )模型。跨城市的宏观标度率是指,随着城市人口增长,城区GDP、人均收入、与人的交互所相关的变量随人口呈现的超线性增长。李睿琪发现,大城市的聚集效应和超线性特征更明显。
宏观标度背后的规律是什么?它促进了人的非线性交互作用,产生更多碰撞。城市的版图上点与点间的“距离”因城市道路的存在而产生形变,已不仅仅是二维,而是要从高维流去分析。李睿琪希望将来的研究能解决这些问题:人群的非线性交互究竟包含哪些因素或机制?交通系统如何改变城市空间?人流、物流、资本流如何塑造我们的城市与发展?
延伸阅读:
09 张江 从规模理论看人类文明进程
集智俱乐部创始人、北京师范大学系统科学学院教授张江,从几年前就是杰弗里·韦斯特“规模理论”的合作研究者。
规模理论的核心,是展现生物体规模和寿命的关系的克雷伯定律(Kleiber Law) 。虽然这个定律能适用不同规模的生物,但人类其中一个离群点。在城市中,也有类似的“ 1.15 律”——随着城市规模增大,新陈代谢增大,指数是大于 1 的超线性增长。
这就带来了城市人口动力学的问题。随着超线性增长的累积、科技革新的速率越来越快,个人生产力上升,然后新一轮的上升又开始进行。城市如何避免崩溃点的到来呢?张江认为,问题根源在社会互动,在城市中,各个节点距离十分近,交互太容易了。此时老子的思想就很可贵——小国寡民、民至老死不相往来。
延伸阅读:
10 苑明理 变换时空 —— 从媒介的实践性和空间性看互联网与 AI 的发展
苑明理,彩云科技联合创始人、工程师,也是中国最早期的 Wiki 爱好者,他分享了自己对互联网作为媒介的见解和观察。
他用媒介的时间性和空间性看互联网和AI的发展。空间与时间理论最早由加拿大经济史学家英尼斯提出,时间的媒介是具有持久性的,如羊皮纸、石头等;而强调空间的则更轻薄,但不易长久保存,如纸张。苑明理受到启发,但又不完全继承该理论,产生了将传统空间与互联网新空间进行对比的想法:传统空间里,一个节点的信息交流被限制在该节点地理空间附近;互联网出现后,可以跨地理作连接。互联网继续发展,SNS出现,人格嵌入互联网,使信息变得交流紧密,但也变得更廉价。人类越来越聚类,会自发寻找与自己带有相似标签的人,这些标签之间存在关联性,然后会导致小圈子的封闭。在没有AI助力的情况下,人的认知和维系社会关系的带宽会很有限。
延伸阅读:
11 刘知远 知识指导的自然语言处理
刘知远是清华大学计算机系副教授,早年的研究兴趣是关键词抽取和社会标签推荐,现在偏重知识图谱、表示学习和社会计算。
自然语言处理的本质,是从无结构序列中预测有结构的语义。但自然语言理解目前面临着理解知识的挑战。从字面意思到弦外之音的跃迁,仍需要人工建模。近年,深度学习技术在自然语言处理上取得巨大突破。刘老师介绍了知识指导的方法,用知识指导深度学习,以从互联网上提取更多信息变成知识,反哺理解过程。
用还原论思想,可以把语言还原到小原子,对文本进行细粒度分析。词并不是最小表示系统,词义之下还有更小的意义单元,为义原。神经网络难以掌握词,但是词背后的义元标注体系让这个成为可能。义原语言知识突破词汇屏障,对语言理解极具重要意义,具有极佳容和深度学习的特性。用知识指导预训练语言模型,然后深度学习自然语言处理技术便可反过来从大规模文本中获取知识。语言使用的深度理解背后是复杂知识,刘老师的愿景就是愿景就是建立由知识指导自然语言处理的循环。
延伸阅读:
12 徐绘敏 Computational Storytelling —— 叙事情感在社会实践中的传播和影响
南京大学新闻传播学院在读研究生徐绘敏,参与了一项基于词向量方法的计算叙事研究。
首先对词汇进情感分析,在从悲伤到快乐的光谱定位一个情感值,然后将其中的词对应到情感值数据,即会得到很有意思的结果。例如在灰姑娘的故事里,通过情感值统计得到的曲线图,和剧情的起伏脉络相符。再如,对比《简爱》等女性主角电影和《阿甘正传》等男性主角电影,会发现女性需要更多的陪伴,而男性电影中女性的陪伴并不那么必要,男性作为行动者(actor)的情形更多。在主流电影叙事中,女性角色遇到男性角色前后,情绪处于光谱的负值,而男性角色的出现使女性角色的情感值上升。她的研究揭示了文学作品感性内容背后的一些模式。
延伸阅读:
13 刘河庆 深入政策文本:文件传递系统中的政策内容再生产
刘河庆是华中科技大学讲师、中山大学社会学与社会工作系博士,研究兴趣是政策语义和政策扩散等。
他介绍了自己的政策扩散研究。政策文本很难量化,但他用政策再生产为指标,对各地方政府对中央政策的反应进行了量化。2014 年 5 月,中央首次直接发布针对农村环境问题的正式政策文件,刘河庆收集数据发现,各省对中央政策的采纳时间和再生产程度都不同。他统计了政策内容再生产的时间及空间差异,发现省级政府对中央政策有不同的反应内在机制。
延伸阅读:
14 牟牧云 互联网上的创新扩散与最大化信息网络
牟牧云是北京师范大学系统科学学院2019届的直博生,本科学习智能科学与技术。
创新扩散是指在社会体系中的个人,随着时间推移,通过不同渠道传播关于新事物的信息并接纳新事物的过程。具体案例有拼多多的扩张、“996”的说法从程序员社区扩散到全民讨论的过程等。
互联网上的创新扩散有些特有的特征,它不同于层级分明的传统结构,而是去中心化的网络结构,每个用户都可以成为信息的发出者;另外,网上的再传播符合“注意-接纳-再传播”模型。牟牧云提出两个问题:什么样的信息更容易导致人们传播?利用情感、兴奋程度、参与性、争议性、新颖性引起注意力,“标题党”就是引起注意最好的例子;一项研究微博为文本进行的情感分析研究显示,愤怒情绪最易传播。第二个问题是,为达到信息传播最大化,如何选择信息源节点?这个问题有很高的应用价值,如利用在广告、计算机影响最大化等。
延伸阅读:
当天,每场演讲后还安排了 Q&A环节,有不少现场听众提出非常有建设性的建议和问题,也有现场嘉宾作出精彩评论。活动也在 Bilibili 上进行了全程直播,有网友提出了问题,讲者对部分问题做出回答。
从社交网络到生态系统,从城市的结构到语言的结构,从机器学习到量子信息,这场跨学科的复杂系统盛宴,不仅横跨物理学、语言学、政治学、社会学、计算机科学等多个学科,更展现了复杂系统及相关理论的现实应用意义。它不仅仅是 21 世纪最前沿的方向,更能解决许多技术的或普世的问题。
现场精彩集锦
作者:郭宝婷
编辑:陈曦、王怡蔺
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!